科研星球

如何查询一个基因和某一个通路的相关性?

   前几天一个小伙伴问:怎么查看一个基因和某一个通路之间的相关性。这里就简单的提供一个可能的解决办法,供有相同需求的小伙伴参考。


这里我们就假设我们想要查看ACE2和Cell Cycle信号通路之间有没有关系。对于这样的目的,我们第一步肯定是要查询两者在之前的研究当中是否有关系。


1. 确定之前的研究结果

对于之前研究结果的确定的话,我们可以通过genecards来查询。genecards当中总结了这个基因应该参与哪些经典的通路。在genecards里面汇总了KEGG等多个通路数据库当中的信息。所以在这里,我们基本上能清楚这个基因主要是参与哪些基因。


下载.jpeg

经过查询,我们发现基于这个基因本身的功能,它和Cell Cycle信号通路是没有关系的。

2. 确定基因和信号通路内的基因的关系

经过上面的查询,我们发现这个基因并不参与细胞周期信号通路的调控。那这个基因不参与这个通路并不能代表这个基因和通路内的基因没有关系。因此,我们查看查看这个基因和通路内的基因是否存在关系。那么首先第一步,就是需要知道通路内都有哪些基因。

2.1 查询通路内的基因

我们可以通过KEGG等通路数据库来查询某一个通路内的基因都有哪些。这里我们推荐另外一个通路查询数据库: PathCards(https://pathcards.genecards.org/)。这个数据库和我们刚刚提到的genecards是一个机构的。这个数据库汇总了KEGG等多个数据库的一个综合性通路查询数据库。下载 (1).jpeg

在这个数据库,我们输入Cell Cycle即可获得符合检索条件的通路,进一步的我们可以看到这个通路内都有哪些基因。下载 (2).jpeg

就这样,我们就获得了目标通路的所有基因了。

2.2 蛋白相互作用分析

在我们获得基因之后,最基本的相互作用分析,能想到的就是我们之前介绍的蛋白相互所有分析(PPI),我们可以把获得的基因内的所有基因以及目标基因(ACE2),统一放到STRING里面,就可以查看ACE2和其他基因有没有关系了。


经过分析,我们发现,ACE2只是在文本挖掘的结果当中与CDK4基因可能存在相互作用关系。这个结果照这个情况来看,还不是特别确定。因此在目前的蛋白相互相互作用的层面,有可能这这个基因和细胞周期相关基因是没有关系的。

下载 (3).jpeg


2.3 共表达分析

我们做的是在蛋白层面观察基因之前是否存在相互作用关系。但是在mRNA层面的话,还没有查看具体的相关性。这个时候,我们用到的就是类似芯片或者RNA-seq方面的东西了。之前我们在单基因如果开展研究的帖子当中,提到了过最好是能在GEO里面找到有人做过的相关敲除或者过表达这个基因的芯片。这样的话,我们查看一下差异基因就可以了。经过查询,我们发现并没有ACE2相关的过表达/敲除芯片下载 (4).jpeg

既然没有的话,那我们就只能使用疾病相关的数据来提取目标基因的表达,来进行相关分析,进而来查看这些基因的是否存在共表达关系了。如果是肿瘤研究的话,那直接就使用TCGA的数据就可以来进行研究。如果是其他疾病的话,那可能就需要去GEO里面搜索自己想有的数据集了。对于TCGA的数据,也是有很好的数据库来直接得到分析结果的。例如,我们这里想要看在肠癌当中ACE2和这些基因的关系,那么我们就可以在cbioportal数据库当中,寻找共表达基因。这样,我们就可以获得和ACE2存在共表达关系的基因了。



由于细胞周期相关的基因有100+,我们不能一个一个来检索相关结果。所以我们就把相关的结果全部下载下来之后,在excel当中进行一下vlookup一下。最后我们发现,ACE2和16个细胞周期相关基因存在共表达关系。


下载 (6).jpeg

写到最后

最后我们的共表达分析当中,可以找到和16个和目标基因相关的存在共表达关系。但是由于只是相关分析,我们并不清楚说这些基因和目标基因到底是谁影响谁,所以只能说通过后续的实验来进行验证。另外的话,我们这里做的还是简单的看基因和基因之间的相关性。进一步的,我们其实可以通过一些算法类似GSVA来评价细胞周期的整个通路和基因是否具有相关性。这样的话,可能更好吧。不过这样做法需要一定的门槛。没有上面我们介绍的这些简单。所以还是可以先从简单的来学习的。


没有账号?